哈囉大家好!!
今天還是從我們的餐廳例子出發,我們要使用機器學習模型用帳單總金額去預測小費,如果我們將性別作為我們的標籤,然後使用小費和帳單總金額來預測客人的性別,我們希望的結果是把男生分成一群,女生分成一群,中間用一條線切開,如果用回歸的那條直線,可能沒辦法把男生和女生分開來,因此我們要使用分類(classifacation)。
性別可以分為男生、女生或第三性,這是離散的數據,並不像我們的小費金額是連續的數據,在使用性別作為我們的標籤及預測目標時,這個問題是分類問題,我們要建立一個分隔男生和女生的決策邊界,有兩類性別,女性和男性,我們可能會使用這種方式:如果小費金額大於帳單總金額的0.8倍,我們預測付錢的客人是男生,用這種方式去做男生跟女生的分類,在分類問題中,我們希望最小化我們的預測和標籤之間的錯誤或錯誤分類。這通常使用cross entropy來完成。
明天我將帶大家繼續認識ML的歷史,那我們明天見~~~